Text copied to clipboard!
Заглавие
Text copied to clipboard!Инженер по надеждност на сайта
Описание
Text copied to clipboard!
Търсим Инженер по надеждност на сайта, който да се присъедини към нашия екип и да играе ключова роля в поддържането на стабилността, производителността и надеждността на нашите уеб приложения и инфраструктура. Като част от екипа по надеждност на сайта (SRE), вие ще работите в тясно сътрудничество с екипите по разработка, операции и сигурност, за да осигурите безпроблемна работа на нашите системи в реално време.
Вашата основна задача ще бъде да изграждате автоматизирани решения за мониторинг, предупреждение и възстановяване, които да минимизират времето на престой и да подобрят потребителското изживяване. Ще анализирате инциденти, ще идентифицирате основните причини и ще прилагате дългосрочни решения за предотвратяване на бъдещи проблеми. Освен това ще участвате в проекти за оптимизация на производителността, управление на капацитета и внедряване на нови технологии.
Идеалният кандидат има силен технически опит в областта на Linux системите, облачните платформи (като AWS, GCP или Azure), автоматизацията чрез скриптове (Python, Bash и др.), както и опит с инструменти за мониторинг и логиране като Prometheus, Grafana, ELK Stack или Datadog. Очакваме също така да имате добро разбиране на CI/CD процесите и практиките за управление на инциденти.
Работата изисква аналитично мислене, способност за бързо реагиране при критични ситуации и желание за непрекъснато учене и усъвършенстване. Ако сте мотивиран професионалист, който иска да работи в динамична среда и да допринася за стабилността на мащабни системи, ще се радваме да се запознаем с вас.
Отговорности
Text copied to clipboard!- Осигуряване на висока наличност и надеждност на уеб приложенията
- Разработване и поддръжка на системи за мониторинг и предупреждение
- Анализ и разрешаване на инциденти и проблеми в продукционна среда
- Автоматизация на рутинни операции и процеси
- Сътрудничество с екипите по разработка за внедряване на нови функционалности
- Оптимизация на производителността и управление на капацитета
- Участие в дежурства за поддръжка извън работно време
- Документиране на процеси, архитектури и инциденти
- Идентифициране и прилагане на добри практики за сигурност и надеждност
- Подобряване на CI/CD процесите и инфраструктурата
Изисквания
Text copied to clipboard!- Бакалавърска степен по компютърни науки или свързана област
- Опит с Linux/Unix системи и администриране на сървъри
- Добри познания по скриптови езици като Python, Bash или Go
- Опит с облачни платформи като AWS, GCP или Azure
- Познания по инструменти за мониторинг и логиране (напр. Prometheus, Grafana, ELK)
- Разбиране на CI/CD процеси и инструменти (Jenkins, GitLab CI и др.)
- Умения за работа в екип и комуникация
- Аналитично мислене и способност за решаване на проблеми
- Желание за учене и прилагане на нови технологии
- Предимство е опит с Kubernetes и Docker
Потенциални въпроси за интервю
Text copied to clipboard!- Какъв е вашият опит с мониторинг и логиране на системи?
- Работили ли сте с облачни платформи и кои?
- Как подхождате към анализ на инциденти и откриване на основни причини?
- Какви инструменти използвате за автоматизация?
- Имате ли опит с CI/CD процеси и какви технологии сте използвали?
- Как се справяте със стресови ситуации и критични инциденти?
- Какви са вашите силни страни като инженер по надеждност?
- Какво ви мотивира да работите в тази роля?
- Какви са вашите дългосрочни професионални цели?
- Какво знаете за нашата компания и защо искате да се присъедините към нас?